Stable Diffusion

Stable Diffusion
Tipus	Model de text a imatge, latent variable model (en) i Models de difusió
Versió inicial	22 agost 2022
Versió estable	SDXL 1.0 (26 juliol 2023); 0.0.1 (22 juny 2023)
Llicència	CreativeML Open RAIL-M (en)
Epònim	Models de difusió
Característiques tècniques
Sistema operatiu	Linux, macOS i Microsoft Windows
Escrit en	Python
Codi font	Fonts de codi
Codi font	Codi font
Més informació
Lloc web	stability.ai… (anglès)
Id. Subreddit	stablediffusion

Stable Diffusion és un model d'aprenentatge profund de text a imatge llançat el 2022. S'utilitza principalment per a generar imatges detallades condicionades a descripcions de text, tot i que també es pot aplicar a altres tasques com ara la restauració d'imatges, repintar i generar traduccions d'imatge a imatge guiades per una entrada de text.^[1]

Stable Diffusion és un model de difusió latent, una varietat de xarxes neuronals generatives profundes desenvolupades pel grup CompVis de la LMU de Múnic.^[2] El model ha estat llançat per una col·laboració de Stability AI, CompVis LMU i Runway amb el suport d'EleutherAI i LAION. ^[3]^[4]^[5] L'octubre de 2022, Stability AI va recaptar 101 milions de dòlars en una ronda liderada per Lightspeed Ventures i Coatue.^[6]

El codi i els pesos del model de Stable Diffusion són públics^[7] i es pot executar amb la majoria de maquinari de consum equipat amb una GPU modesta. Això va marcar una diferència dels models propietaris anteriors de text a imatge, com ara DALL-E i Midjourney, als quals només es podia accedir mitjançant serveis al núvol.^[8]^[9]

↑ «Diffuse The Rest - a Hugging Face Space by huggingface». huggingface.co. Arxivat de l'original el 2022-09-05. [Consulta: 5 setembre 2022].
↑ Rombach, Robin; Blattmann, Andreas; Lorenz, Dominik; Esser, Patrick; Ommer, Björn «High-Resolution Image Synthesis with Latent Diffusion Models». arXiv:2112.10752 [cs], 13-04-2022.
↑ Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-launch
↑ Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-github
↑ «Revolutionizing image generation by AI: Turning text into images». LMU Munich. [Consulta: 17 setembre 2022].
↑ Wiggers, Kyle. «Stability AI, the startup behind Stable Diffusion, raises $101M» (en anglès). Techcrunch. [Consulta: 17 octubre 2022].
↑ «Stable Diffusion», 27-12-2022. [Consulta: 27 desembre 2022].
↑ «The new killer app: Creating AI art will absolutely crush your PC». PCWorld. Arxivat de l'original el 2022-08-31. [Consulta: 31 agost 2022].
↑ Vincent, James. «Anyone can use this AI art generator — that’s the risk» (en anglès americà), 15-09-2022. [Consulta: 27 desembre 2022].

[1] «Diffuse The Rest - a Hugging Face Space by huggingface». huggingface.co. Arxivat de l'original el 2022-09-05. [Consulta: 5 setembre 2022].

[2] Rombach, Robin; Blattmann, Andreas; Lorenz, Dominik; Esser, Patrick; Ommer, Björn «High-Resolution Image Synthesis with Latent Diffusion Models». arXiv:2112.10752 [cs], 13-04-2022.

[stable-diffusion-launch-3] Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-launch

[stable-diffusion-github-4] Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-github

[5] «Revolutionizing image generation by AI: Turning text into images». LMU Munich. [Consulta: 17 setembre 2022].

[6] Wiggers, Kyle. «Stability AI, the startup behind Stable Diffusion, raises $101M» (en anglès). Techcrunch. [Consulta: 17 octubre 2022].

[7] «Stable Diffusion», 27-12-2022. [Consulta: 27 desembre 2022].

[pcworld-8] «The new killer app: Creating AI art will absolutely crush your PC». PCWorld. Arxivat de l'original el 2022-08-31. [Consulta: 31 agost 2022].

[9] Vincent, James. «Anyone can use this AI art generator — that’s the risk» (en anglès americà), 15-09-2022. [Consulta: 27 desembre 2022].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Stable Diffusion

From Wikipedia, the free encyclopedia · View on Wikipedia